¿Qué es la Inteligencia Artificial (IA)?

¿Qué es la IA?

La inteligencia artificial (IA) es una tecnología que permite a ordenadores y máquinas simular la inteligencia humana y su capacidad para resolver problemas.

Por sí sola o combinada con otras tecnologías (por ejemplo, sensores, geolocalización, robótica), la IA puede realizar tareas que de otro modo requerirían la inteligencia o intervención humana. Los asistentes digitales, la guía por GPS, los vehículos autónomos y las herramientas de inteligencia artificial generativa (como Chat GPT de Open AI) son solo algunos ejemplos de inteligencia artificial en las noticias diarias y en nuestra vida diaria.

Como campo de la informática, la inteligencia artificial engloba (y a menudo se menciona junto con) el machine learning y el deep learning. Estas disciplinas implican el desarrollo de algoritmos de IA, modelados a partir de los procesos de toma de decisiones del cerebro humano, que pueden "aprender" de los datos disponibles y hacer clasificaciones o predicciones cada vez más precisas a lo largo del tiempo.

La inteligencia artificial ha pasado por muchos ciclos de exageración, pero incluso para los escépticos, el lanzamiento de ChatGPT parece marcar un punto de inflexión. La última vez que la IA generativa tuvo tanta atención, los avances se produjeron en la visión por ordenador, pero ahora el salto adelante está en el procesamiento del lenguaje natural (PLN). Hoy en día, la IA generativa puede aprender y reproducir no solo el lenguaje humano sino también otros tipos de datos como imágenes, vídeo, código de software e incluso estructuras moleculares.

Las aplicaciones para la IA crecen cada día. Pero a medida que aumenta el revuelo en torno al uso de herramientas de IA en las empresas, las conversaciones sobre la ética de la IA y su responsabilidad se vuelven de vital importancia. Para obtener más información sobre la posición de IBM en estos temas, lea Building trust in AI.

Por qué la gobernanza de IA es un imperativo empresarial para escalar la IA empresarial

Conozca los obstáculos para la adopción de la IA, en particular la falta de soluciones de gestión de riesgos y gobierno de la IA.

Contenido relacionado

Regístrese para recibir la guía sobre modelos fundacionales

Comience su viaje hacia la IA

Aprenda a escalar la IA

Explore la AI Academy

Tipos de inteligencia artificial: IA débil frente a IA sólida

La IA débil, también llamada IA estrecha o inteligencia artificial estrecha (ANI, por sus siglas en inglés), está entrenada y enfocada en la IA para realizar tareas específicas. La inteligencia artificial débil sustenta la mayor parte de la IA que nos rodea hoy en día. "Angosta" podría ser un descriptor más adecuado para este tipo de IA, ya que es cualquier cosa menos débil: permite algunas aplicaciones muy robustas, como Siri de Apple, Alexa de Amazon, IBM watsonx™ y los vehículos de conducción autónoma.

La IA sólida está formada por la inteligencia artificial general (AGI) y la superinteligencia artificial . La AGI, o IA general, es una forma teórica de IA en la que una máquina tendría una inteligencia igual a la humana; sería autoconsciente con una conciencia que tendría la capacidad de resolver problemas, aprender y planificar el futuro. La ASI, también conocida como superinteligencia, superaría la inteligencia y la capacidad del cerebro humano. Aunque la IA fuerte sigue siendo totalmente teórica y no existen ejemplos prácticos en la actualidad, eso no significa que los investigadores de IA no estén explorando su desarrollo. Mientras tanto, los mejores ejemplos de ASI pueden encontrarse en la ciencia ficción, como HAL, el asistente informático superhumano y malvado de 2001: Una odisea en el espacio.

Aprendizaje profundo frente aprendizaje automático

Dado que el aprendizaje profundo y el aprendizaje automático tienden a utilizarse indistintamente, conviene señalar los matices entre ambos. Como ya se ha mencionado, tanto el aprendizaje profundo como el aprendizaje automático son subcampos de la inteligencia artificial, y el aprendizaje profundo es en realidad un subcampo del aprendizaje automático.

En realidad, el aprendizaje profundo está compuesto por redes neuronales. "Profundo" en aprendizaje profundo se refiere a una red neuronal compuesta por más de tres capas, que incluirían las entradas y la salida, puede considerarse un algoritmo de aprendizaje profundo. Esto generalmente se representa mediante el siguiente diagrama.

La diferencia entre el aprendizaje profundo y el aprendizaje automático tiene que ver con la forma en que aprende cada algoritmo. El aprendizaje profundo automatiza gran parte del proceso de extracción de características, eliminando parte de la intervención humana manual necesaria y permitiendo el uso de conjuntos de datos más grandes. Se puede pensar en el aprendizaje profundo como en un "aprendizaje automático escalable", como señaló Lex Fridman en la misma conferencia del MIT. El aprendizaje automático clásico, o "no profundo", depende más de la intervención humana para aprender. Los expertos humanos determinan la jerarquía de características para comprender las diferencias entre las entradas de datos, lo que suele requerir datos más estructurados para aprender.

El aprendizaje automático "profundo" puede aprovechar conjuntos de datos etiquetados, también conocidos como aprendizaje supervisado, para informar al algoritmo, pero no requiere necesariamente un conjunto de datos etiquetados. Puede ingerir datos no estructurados en su forma bruta (p. ej. texto, imágenes) y puede determinar automáticamente la jerarquía de entidades que distinguen diferentes categorías de datos entre sí. A diferencia del aprendizaje automático, no requiere intervención humana para procesar los datos, lo que nos permite escalar el aprendizaje automático de formas más interesantes.

El auge de los modelos generativos

La IA generativa se refiere a modelos de aprendizaje profundo que pueden tomar datos brutos, por ejemplo, toda la Wikipedia o la colección de obras de Rembrandt, y "aprender" a generar resultados estadísticamente probables cuando sea necesario. A un nivel superior, los modelos generativos codifican una representación simplificada de los datos de entrenamiento y se basan en ella para crear un resultado similar, pero no idéntico, a los datos originales.

Los modelos generativos se han utilizado durante años en estadística para analizar datos numéricos. Sin embargo, el auge del aprendizaje profundo permitió ampliarlos a imágenes, voz y otros tipos de datos complejos.Entre los primeros modelos que lograron esta hazaña se encuentran los autocodificadores variacionales, o VAE, por sus siglas en inglés, introducidos en 2013. Los VAE fueron los primeros modelos de aprendizaje profundo que se utilizaron ampliamente para generar imágenes y voz realistas.

“Los VAE la puerta al modelado generativo profundo al facilitar la escalabilidad de los modelos”, afirma Akash Srivastava, experto en IA generativa del MIT-IBM Watson AI Lab.
“Gran parte de lo que hoy consideramos IA generativa comenzó aquí”.

Los primeros ejemplos de modelos, como GPT-3, BERT o DALL-E 2, han demostrado lo que es posible. El futuro está en los modelos entrenados con un gran conjunto de datos sin etiquetar que puedan utilizarse para distintas tareas con una optimización mínima.Los sistemas que realizan tareas específicas en un único dominio están dando paso a una IA más amplia que aprende de forma más general y opera en múltiples dominios y problemas. Los modelos de base, entrenados en grandes conjuntos de datos no etiquetados y optimizados para una serie de aplicaciones, están impulsando este cambio.

En lo que respecta a la IA generativa, se prevé que los modelos fundacionales
aceleren drásticamente la adopción de la IA en las empresas. La reducción de los requisitos de etiquetado facilitará mucho a las empresas embarcarse en esta aventura, y la automatización altamente precisa y eficiente impulsada por la IA que permiten significará que muchas más empresas serán capaces de desplegar la IA en una gama más amplia de situaciones de misión crítica. Para IBM, la esperanza es que la potencia de los modelos fundacionales pueda llevarse a todas las empresas en un entorno de nube híbrida sin precedentes.

Explore los modelos fundacionales en watsonx.ai

Aplicaciones de inteligencia artificial

Hoy, existen numerosas aplicaciones reales de sistemas de IA. A continuación se presentan algunos de los casos de uso más comunes:

reconocimiento de voz

También conocido como reconocimiento automático de voz (ASR), reconocimiento de voz por ordenador o conversión de voz a texto, el reconocimiento de voz utiliza PLN para procesar el habla humana en un formato escrito. Muchos dispositivos móviles incorporan el reconocimiento de voz en sus sistemas para realizar búsquedas por voz (Siri, por ejemplo) o proporcionar más accesibilidad en torno a los mensajes de texto en inglés o en muchos idiomas ampliamente utilizados. Vea cómo Don Johnston utilizó IBM watsonx Text to Speech para mejorar la accesibilidad en el aula con nuestro caso práctico.

Servicio al cliente

Los agentes virtuales en línea y los chatbots están sustituyendo a los agentes humanos a lo largo del recorrido del cliente. Responden a las preguntas más frecuentes (FAQ) sobre temas como el envío o proporcionan recomendaciones personalizadas, realizan ventas cruzadas de productos o sugieren tallas a los usuarios, cambiando la forma de concebir el compromiso con el cliente en sitios web y plataformas de redes sociales. Algunos ejemplos son los bots de mensajería de los sitios de comercio virtual con agentes, kas aplicaciones de mensajería, como Slack y Facebook Messenger, y tareas realizadas habitualmente por asistentes y asistentes de voz. Vea cómo Autodesk Inc. utilizó IBM watsonx Assistant para acelerar los tiempos de respuesta al cliente en un 99 % con nuestro caso práctico.

Computer vision

Esta tecnología de IA permite a los ordenadores y sistemas obtener información significativa a partir de imágenes digitales, vídeos y otras entradas visuales, y basándose en esas entradas, puede actuar. Esta capacidad de asesoramiento la distingue de las actividades de reconocimiento de imágenes. Gracias a las redes neuronales convolucionales, la visión por ordenador tiene aplicaciones en el etiquetado de fotos en las redes sociales, las imágenes radiológicas en la sanidad y los coches autónomos en la industria del automóvil.. Descubra cómo ProMare utilizó IBM Maximo para establecer un nuevo rumbo para la investigación oceánica con nuestro estudio de caso.

Cadena de suministro

La robótica adaptativa actúa sobre la información de los dispositivos de Internet de las cosas (IoT) y sobre datos estructurados y no estructurados para tomar decisiones autónomas. Las herramientas de PNL pueden comprender el habla humana y reaccionar a lo que se les dice. El análisis predictivo se aplica a la capacidad de respuesta de la demanda, la optimización del inventario y la red, el mantenimiento preventivo y la fabricación digital. Los algoritmos de búsqueda y reconocimiento de patrones, que ya no son solo predictivos, sino jerárquicos, analizan datos en tiempo real, ayudando a las cadenas de suministro a reaccionar a la inteligencia aumentada generada por máquinas, al tiempo que brindan visibilidad y transparencia instantáneas. Vea cómo Hendrickson utilizó IBM Sterling para impulsar transacciones en tiempo real con nuestro estudio de caso.

Previsión meteorológica

Los modelos meteorológicos en los que se basan las emisoras para hacer pronósticos precisos consisten en algoritmos complejos que se ejecutan en supercomputadoras. Las técnicas de machine learning mejoran estos modelos al hacerlos más aplicables y precisos. Descubra cómo Emnotion utilizó IBM Cloud para ayudar a las empresas sensibles al clima a tomar decisiones más proactivas y basadas en datos con nuestro caso práctico.

Detección de anomalías

Los modelos de IA pueden analizar grandes cantidades de datos y descubrir puntos de datos atípicos dentro de un conjunto de datos. Estas anomalías pueden llamar la atención sobre equipos defectuosos, errores humanos o fallos de seguridad. Vea cómo Netox utilizó IBM QRadar para proteger las empresas digitales de las ciberamenazas con nuestro estudio de caso.

Historia de la inteligencia artificial: fechas y nombres clave

La idea de "una máquina que piensa" se remonta a la antigua Grecia. Sin embargo, desde la llegada de la informática electrónica (y en relación con algunos de los temas tratados en este artículo), los acontecimientos clave en la evolución de la inteligencia artificial son los siguientes:

1950: Alan Turing publica Computing Machinery and Intelligence (enlace externo a ibm.com). En este artículo, Turing, famoso por descifrar el código alemán ENIGMA durante la Segunda Guerra Mundial y a menudo conocido como el "padre de la informática", hace la siguiente pregunta: "¿Pueden pensar las máquinas?" A partir de ahí, propone una prueba, ahora conocida como la "Prueba de Turing", en la que un interrogador humano intentaría distinguir entre la respuesta de un ordenador y la de un texto humano. Aunque esta prueba ha sido objeto de mucho escrutinio desde su publicación, sigue siendo una parte importante de la historia de la IA, así como un concepto actual dentro de la filosofía, ya que utiliza ideas en torno a la lingüística.

1956: John McCarey acuña el término "inteligencia artificial" en la primera conferencia sobre IA en el Dartouth College. (McCarthy inventaría después el lenguaje Lisp). Más tarde, ese mismo año, Allen Newell, J.C. Shaw y Herbert Simon crearon Logic Theorist, el primer programa de software de IA operativo.

1967 Frank Rosenblatt construye el Mark 1 Perceptron, el primer ordenador basado en una red neuronal que "aprendía" mediante ensayo y error. Justo un año después, Marvin Minsky y Seymour Papert publican un libro titulado Perceptrons, que se convirtió tanto en la obra fundamental sobre redes neuronales como, al menos durante un tiempo, en un argumento en contra de futuros proyectos de investigación en redes neuronales.

Década de 1980: Las redes neuronales que utilizan un algoritmo de retropropagación para entrenarse se utilizan ampliamente en aplicaciones de IA.

1995: Stuart Russell y Peter Norvig publican Inteligencia Artificial: Un enfoque moderno (enlace externo a ibm.com), que se convierte en uno de los libros de texto líderes en el estudio de la IA. En él, profundizan en cuatro posibles objetivos o definiciones de la IA, que diferencian los sistemas informáticos en función de la racionalidad y el pensamiento frente a la actuación.
1997: Deep Blue de IBM vence al entonces campeón mundial de ajedrez Garry Kasparov, en una partida de ajedrez (y revancha).
2004: John McCarthy escribe un artículo, ¿Qué es la inteligencia artificial? (enlace externo a ibm.com), y propone una definición de IA que se cita a menudo.

2011: IBM watsonx vence a los campeones Ken Jennings y Brad Rutter

2015: El superordenador Minwa de Baidu utiliza un tipo especial de red neuronal profunda denominada red neuronal convolucional para identificar y categorizar imágenes con una tasa de precisión superior a la del ser humano medio.

2016: El programa AlphaGo de DeepMind, impulsado por una red neuronal profunda, vence a Lee Sodol, campeón del mundo de Go, en un combate a cinco partidas. La victoria es significativa dado el enorme número de movimientos posibles a medida que avanza la partida (¡más de 14,5 billones tras solo cuatro movimientos!). Más tarde, Google compró DeepMind por 400 millones de dólares.

2023: El auge de los grandes modelos lingüísticos, o LLM, por sus siglas en inglés, como ChatGPT, supone un
enorme cambio en el rendimiento de la IA y su potencial para impulsar el valor empresarial. Con estas nuevas prácticas de IA generativa, los modelos de deep learning pueden preentrenarse en vastas cantidades de datos sin procesar ni etiquetar.

Soluciones relacionadas

Soluciones de inteligencia artificial (IA)

Ponga la IA al servicio de su negocio con la experiencia líder del sector y la cartera de soluciones de IA de IBM.

Explore las soluciones de IA

Servicios de IA

Reinvente las operaciones y flujos de trabajo críticos añadiendo IA para maximizar las experiencias, la toma de decisiones en tiempo real y el valor empresarial.

Explore los servicios de IA

IA para ciberseguridad

La IA está cambiando las reglas del juego de la ciberseguridad, analizando cantidades masivas de datos de riesgo para acelerar los tiempos de respuesta y aumentar las operaciones de seguridad con recursos insuficientes.

Explore la IA para la ciberseguridad

Recursos

Cómo elegir el modelo fundacional de IA adecuado

Aprenda a usar el marco de selección de modelos para seleccionar el modelo fundacional para las necesidades de su empresa.

Ahorre hasta un 70 % con nuestra suscripción de aprendizaje digital

Acceda a nuestro catálogo completo de más de 100 cursos en línea adquiriendo hoy mismo una suscripción de aprendizaje individual o multiusuario que le permitirá ampliar sus conocimientos en una amplia gama de nuestros productos a un precio reducido.

2023 Gartner Peer Insights Customers' Choice

IBM watsonx Assistant reconocido como Customer' Choice en el informe Gartner Insights Voice of the Customer para Plataformas de IA conversacional para empresas

Estrategia de adquisiciones mejorada por IA

Descubra cómo el machine learning puede predecir la demanda y reducir los costes.

Dé el siguiente paso

Entrene, valide, ajuste e implemente IA generativa, modelos fundacionales y capacidades de machine learning con IBM watsonx.ai, un estudio empresarial de próxima generación para constructores de IA. Cree aplicaciones de IA en menos tiempo y con menos datos.

Explore watsonx.ai

Solicite una demostración en directo